문서자동요약에 있어서 통계적인 기법과 전자메일의 구조적인 특성을 고려하여 시스템을 형태소 분석기능, 문장랭킹기능, 문장추출기능으로 분류하여 좀더 기본적인 내용을 유지 가능하게 하면서 복잡도를 줄이려고 노력하였으며, 현존하는 웹에서 쉽게 구현이 가능하고 멀티유저 환경에 적합하다.
새로운 언어적, 구조적, 영역적 특성 등을 지닌 새로운 문서집합을 추가하는 것은 필요불가결 할 것으로 생각된다. 아울러 단순한 문서검색을 뛰어넘어 문단검색, 구조화검색, 정보추출, 정보요약 등의 새로운 기능을 실험할 수 있는 테스트 컬렉션의 개발 구축에 대한 사항 또한 필요하리라 생각된다.
문서처리비용의 감소, 유통비용의 절감 등의 효익을 기대하는 비용절감전략에 대한 기대가 큰 것으로 나타났다. 또한 산학연 협력을 통한 기술수용정도가 높고, 외부와의 기술제휴가 많으며, 기술개발 투자비가 과다할수록 연구개발에 따른 비용부담이 커질수록 비용절감전략에 대한 기대가 큰 것으
Ⅰ. 서론
먼저, 검색엔진은 각 웹페이지의 정보를 웹으로부터 수집한다. 일반적인 검색엔진은 이 문서수집 과정에서 웹문서들로부터 추출된 텍스트 데이터와 멀티미디어 데이터들을 서로 다른 저장소(Repository)에 분리하여 저장한다. 이때 멀티미디어 데이터들은 그 특성상 데이터 자체에 검색 가능
특성을 파악하는 통계기술을 말하며, 요약수치와 도표로 구성되어 있다. 표본 또는 모집단의 특성을 서술하는 요약수치에는 빈도분포, 집중경향치(최빈치, 중앙값, 평균), 산포도(변산도; 범위, 사분편차, 분산, 표준편차), 백분율 등이 있고, 도표는 히스토그램, 막대도표, 절선도표, 파이차트가 있다.
표본집단에 대하여 총 94개의 KASO 항목에 대하여 빈도, 중요도의 각각의 평균과 표준편차를 구하여 <표 결과-5>에 제시하였다. 또한 표본집단의 KASO 항목들을 점수 별로 나열하여 어떠한 항목들이 중요시되는지를 분석하여 직무기술서에 사용하기 위해 의미가 있는 KASO 항목들을 추출하여 보았다.
“한국 행정학의 전개과정” 중에서 ‘시기’, ‘시대’ 또는 ‘사회’라는 단어가 삽입되어 있는 문장만을 모두 추출하여 교재에 있는 그대로 제시하시오.(35점)2. 조직의 개념과 현대조직의 특성을 설명하고, 이를 바탕으로 오늘날 우리나라 공공조직의 특징에 대한 본인의 생각을 논술하기로 하자.
추출에서의 핵심은 표본의 특성이 전체 대상의 특성을 대표할 수 있는지의 여부, 즉 표본의 대표성이다.
표본추출 시 유의사항으로 표본추출 시 전체 모집단에 변화가 있어서는 안 되고, 표본추출단위를 임의로 변경해서는 안되며, 모집단의 표출단위는 서로 독립적이어야 한다. 단순무작위표본추출
다양성의 특성을 가진 정보 자산”이라고 정의하였다. IDC는 빅데이터란 “데이터베이스가 아닌 업무수행에 초점을 맞추어, ‘다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고 데이터의 초고속 수집, 발굴, 분석을 지원하도록 고안된 차세대기술 및 아키텍처”라고 정의하였다.